📈Холивар: NumPy против pandas против PySpark — кто рулит в данных
Дата-сайентисты, делитесь: чем копаете свои миллионы строк?
🐍NumPy — минимализм и математика • Основа всех ML-библиотек. • Векторы, матрицы, broadcasting — строго, быстро, эффективно. • Если ты знаешь np.dot и np.linalg, тебя зовут в глубины ML.
Но: • Строгая типизация и отсутствие удобных табличек. • Хотел сделать фильтр по колонке? Сначала reshape. • IndexError: too many indices — старая знакомая.
📊pandas — король табличек • df.head() — и ты уже видишь суть. • Гибкость, группировки, фильтрации — словно Excel на стероидах. • Подходит и для EDA, и для препроцессинга.
Но: • Большой датасет? Привет, out of memory. • Интуитивно, но не всегда предсказуемо. • SettingWithCopyWarning — и ты не уверен, изменил ли что-то вообще.
🔥PySpark — big data и кластеры • Когда данных слишком много для pandas. • Распределённые вычисления, lazy evaluation, Spark SQL. • Подходит для продакшена, когда ноутбук уже плачет.
Но: • Стартуем JVM… подождите немного. • Написал три строчки — получил лог на 300 строк. • Не для быстрых экспериментов.
📈Холивар: NumPy против pandas против PySpark — кто рулит в данных
Дата-сайентисты, делитесь: чем копаете свои миллионы строк?
🐍NumPy — минимализм и математика • Основа всех ML-библиотек. • Векторы, матрицы, broadcasting — строго, быстро, эффективно. • Если ты знаешь np.dot и np.linalg, тебя зовут в глубины ML.
Но: • Строгая типизация и отсутствие удобных табличек. • Хотел сделать фильтр по колонке? Сначала reshape. • IndexError: too many indices — старая знакомая.
📊pandas — король табличек • df.head() — и ты уже видишь суть. • Гибкость, группировки, фильтрации — словно Excel на стероидах. • Подходит и для EDA, и для препроцессинга.
Но: • Большой датасет? Привет, out of memory. • Интуитивно, но не всегда предсказуемо. • SettingWithCopyWarning — и ты не уверен, изменил ли что-то вообще.
🔥PySpark — big data и кластеры • Когда данных слишком много для pandas. • Распределённые вычисления, lazy evaluation, Spark SQL. • Подходит для продакшена, когда ноутбук уже плачет.
Но: • Стартуем JVM… подождите немного. • Написал три строчки — получил лог на 300 строк. • Не для быстрых экспериментов.
Among the actives, Ascendas REIT sank 0.64 percent, while CapitaLand Integrated Commercial Trust plummeted 1.42 percent, City Developments plunged 1.12 percent, Dairy Farm International tumbled 0.86 percent, DBS Group skidded 0.68 percent, Genting Singapore retreated 0.67 percent, Hongkong Land climbed 1.30 percent, Mapletree Commercial Trust lost 0.47 percent, Mapletree Logistics Trust tanked 0.95 percent, Oversea-Chinese Banking Corporation dropped 0.61 percent, SATS rose 0.24 percent, SembCorp Industries shed 0.54 percent, Singapore Airlines surrendered 0.79 percent, Singapore Exchange slid 0.30 percent, Singapore Press Holdings declined 1.03 percent, Singapore Technologies Engineering dipped 0.26 percent, SingTel advanced 0.81 percent, United Overseas Bank fell 0.39 percent, Wilmar International eased 0.24 percent, Yangzijiang Shipbuilding jumped 1.42 percent and Keppel Corp, Thai Beverage, CapitaLand and Comfort DelGro were unchanged.
How Does Bitcoin Mining Work?
Bitcoin mining is the process of adding new transactions to the Bitcoin blockchain. It’s a tough job. People who choose to mine Bitcoin use a process called proof of work, deploying computers in a race to solve mathematical puzzles that verify transactions.To entice miners to keep racing to solve the puzzles and support the overall system, the Bitcoin code rewards miners with new Bitcoins. “This is how new coins are created” and new transactions are added to the blockchain, says Okoro.
Библиотека data scientist’а | Data Science Machine learning анализ данных машинное обучение from ar